560万Facebook人际关系数据,揭秘家庭职业传承“真相”


当你走出校门迈向职场,择业时也许很难完全避免来自父母的影响。而这种影响甚至还不是一时,而是打你一出生就已经开始了。

“龙生龙凤生凤”,父母的职业在多大程度上会影响子女的职业呢?Facebook的两位数据科学家通过分析Facebook社交平台上的数百万条职业和人际关系数据,为我们揭示了父母和子女的职业代际传承关系的“真相”。

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

子女选什么职业,多大程度上受到父母的影响?

父母和子女间的关系不只限于基因。父母是孩子的榜样,会为他们提供机会,还会为他们的职业道路提供建议。那么,孩子最终会和父母从事同样的工作吗?其他的兄弟姐妹也会选择一样的职业吗?不同的职业,父母对孩子的影响会有什么不同?

为了弄清这些问题,Facebook凭借自己的社交大数据对这一现象进行了研究。

Facebook分析了移除身份信息后的两组相关的数据:

  • 兄弟姐妹的职业选择
  • 父母子女的职业选择

样本包括了英语语言区在Facebook上关联了各种家人、亲戚关系的这些人,当然这些人也都填写了自己的职业,但需要注意,这些信息都没有经过验证。

Facebook把各类职业划分为几个主要类别,其中军事职业类别存在重复的情况,因为这个类别同时包括了雇主身份、职业分类以及过往的服役记录,而其他工作分类只是基于选择的职业分类。

由于数据不包括那些无法在Facebook上勾选的职业,因此它可能并不代表整体人口,但瑕不掩瑜,研究本身还是很有趣的。

下面这两张图展示的是父亲和儿子、母亲和女儿的职业关联度情况:

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

根据图片来看,子女和父母选择同一个特定职业的可能性,确实因职业而异。

Facebook一共收集了560万份数据,这些数据都来自英语语言区,且父母和子女都填写了职业信息。Facebook先计算了在给定父母职业的情况下子女从事某一职业的概率,比如,一个律师父亲有一个医生儿子的概率是5%。然后,Facebook还计算出这一概率相对于其他行业的情况是个什么程度。结果发现,在这个案例里,法律从业者的儿子比其他行业从业者的儿子,从事医药行业的概率高4.6倍。

对学历要求较高的职业,父母子女间的代际关联度较高

在下面这张可视化网络图中,每个节点表示“职业-性别”的配对,蓝色表示男性,紫色表示女性,例如,标有science字样的紫色节点意思是“女性科学家”。

另外,职业标签都是缩写的。2个节点间的连线和箭头方向,表示父母是某一职业的小孩会在多大程度上选择另外一个职业(注:衡量的标准是和人群的平均水平的比较)。所有线条只有当比平均概率至少大2.5倍以上才会显示,线条越粗,意味着子女选择另个职业的概率更高。

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

通过这样的可视化网络,我们可以了解父母与子女职业之间的联系。比如说,从蓝色的military(军事、军队相关工作)和蓝色的protective service(安保类工作)间这条线可以看出,父亲在军队中工作的话,儿子比平均水平更可能从事安保类的服务(注:至少比平均水平高2.5倍以上)。

通过展示这样一个关系网,并且使用力引导布局算法(force-directed network layout algorithm)把那些代际关系比一般水平高很多的关系放在更靠近的地方,我们可以看到,在上图的左侧,那些需要更高学历知识的职业会聚集得更紧密;另一方面,相对低学历需求的职业在右侧。

尽管相对来说,一个孩子很有可能跟随父母的脚步,但绝对百分比可能还是很低的。比如你的父亲在军队工作,则你入伍的概率是普通情况的5倍,这听上去非常夸张,但其实如果看绝对值,父亲是军人的儿子中,每4个儿子只有1个会选择入伍,也就是25%而已。至于父亲从事农业、渔业、林业的,只有3%的子女继承了这个行业,但还是比总体水平高出了7.6倍。

母亲是白领或者行政人员的女儿里,有20%会从事同样的职业,但这只比一般概率大了两倍。另一方面,如果母亲是医护人员,那女儿有8.5%的几率同样成为医护人员,并且这是总体的3.75倍。

我们也能看到跨性别的职业“继承”,例如:科学家父亲有一个科学家女儿的概率是总体的3.9倍,而律师母亲的儿子也干这一行的概率是总体的6.6倍。

另外需要注意的是,由于家庭背景,孩子进入某些职业的可能性会非常小。比如说,对于父亲从事法律的人来说,他们进入到建筑行业、维修、维护行业的可能性只是平均水平的85%。

除了父母,兄弟姐妹也会影响你的职业选择

接下来我们来看看兄弟姐妹们会不会选择一样的职位?

兄弟姐妹们不仅有一样的父母,对于双胞胎来说,他们还拥有相同的基因。对于同卵双胞胎来说,他们有完全一样的基因,对于异卵双胞胎来说,从基因上来说,他们和兄弟姐妹们没有区别。但不管是同卵还是异卵,双胞胎都是从相似的环境中成长起来的,尽管随着家里孩子数量的增加,父母的教养方式可能会产生变化,比如一个家庭中,对老大的教育可能比较严格,对最小的可能比较宠爱。但我们一般认为双胞胎受到的教养方式还是接近的。

为了分析兄弟姐妹的职业,Facebook收集了237万份数据。数据对象都是美国的同性别兄弟姐妹,并且他们在个人资料中填写了职业信息。

Facebook把兄弟姐妹分成三组:

  • 同性别双胞胎,
  • 年龄相差不超过两岁的同性别的兄弟姐妹,
  • 大样本中任意两个年龄相差不超过两岁的同性别人士。

他们将会比较这三组样本中从事相同工作的概率。不难看出第三组是参照组。

在第二组中,也就是年龄相差不超过两岁的兄弟姐妹间,有15%的几率选择同样的工作,这比第三组任意两个同性别同年龄的人选择相同工作的概率8.6%要高。但更惊人的数据是,双胞胎选择同样职业的概率是24.7%。

下面这些柱状图将这个结论按照职业和性别进行了更具体的细分。

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

560万Facebook人际关系数据,揭秘家庭职业传承“真相”_上海数据分析网

如图,每条柱子有三种不同深浅的颜色。颜色最深最不透明的代表了基准线的概率。稍浅一点的代表了同性别的非双胞胎拥有相同工作的概率。最浅的代表了双胞胎拥有相同工作的概率。

第一张图是按照双胞胎从事同一类职业比例的大小来排序,第二张是按照兄弟姐妹间的大小来排,第三张是基准组。

总结来说,我们可以发现,来自一个家庭的成员倾向于选择相同的职业,特别是对于双胞胎来说。然而,绝大多数的孩子都还是选择了走自己的道路,选择与父母或兄弟姐妹不同的职业。
来源:51CTO 
CPDA课程海报